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Ipuledning 

Min oppfinnelse ang&r en helt ny innfalsvinkel til en ikke-gelbasert DNA- 
sekvenseringsmetode. Helt siden Watson og Crick klarla DNA-molekylets struktur i 
1953 har genforskere onsket a finne raske og billige m&ter k sekvensere DNA- 
molekyler. Den &rste metoden brukte samme prin sippet som for protein-sekvensering: 
molekylet ble fragmentert i mindre biter, base sammensetningen for hver bit kartlagt og 
ved £ finne overlappende sekvenser ble den opprinnelige sekvensen satt sammen. 
Metoden hadde store begrensninger bide med tanke p& starrelsen av DNA-molekylene 
som kunne sekvenseres og tiden som ble brukt. Det var derfor et stort gjennombrudd 
da Sanger/Barrell og Maxam/Gilbert utviklet to nye metoder for DNA-sekvensering i 
Irene 1975-77. AUe metoder som brukes i storre utstrekning i dag er basert pi 
Sanger/Barrels metode og utviklingen innenfor DNA-sekvensering de siste 23 irene 
har stort sett vaert modifiseringer av denne. 

1 1988 kom imidlertid DNA-sekvenseringsteknologi i et helt nytt fokus. Ledet 
an av USA gikk 1 8 land sammen om det kanskje starste enkeltprosjektet i 
vitenskapshistorien; sekvenseringen av hele det humane genom p& 3*10obp («the 
Human Genom Project »), pluss flere and re mindre genomer. Per i dag er mllsettingen 
i bli ferdig i lflFpet av &r 2005. Til tross for at prosjektet binder opp store vitenskapelige 
ressurser og fSr en prislapp pi omlag 9 millbrder $ regnes utbyttet av prosjektet som 
viktig nok til at prisen kan forsvares. 

En viktig del av prosjektet er & utvikle nye metoder for DN A-sekvensering som 
er bade rimeligere og raskere enn dagens teknologi. I prinsippet kan disse inndeles i 
gelbaserte- (stort sett nye varianter av Sanger/Barrell metoden) og ikke-gelbaserte 
teknikker. De ikke-gelbaserte teknikkene har sannsynligvis det sterste potensialet og 
massespektrometri, flowcytometri og bruk av «genchips» som hybridiserer sml DN A- 
molekyler er noen av innfallsvinklene som er under utprevning. Skulle man lykkes i 1 
finne metoder som er vesentlig bedre enn dagens vil det resultere i en revolusjon ikke 
bare for genforskningen men ogsl for modeme medisin da man fir muligheten til 
omfattende gentesting pi pasienter. Det ekonomiske potensialet i en slik metode er 
naturligvis meget stort. 
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Metoden 
Grunnprinsippct 

Som illustrert i fig. 1 kan metoden inndeles i fire trinn: 

Fgrste trinn tar utganspunkt i en ren DNA-populasjon bestiende av DNA-sekvensen 
som skal sekvenseres. DNA-molekylene kuttes/brekkes pi en uspesifikk mite slik at 
det dannes en populasjon med DNA-molekyler bestiende av biter (heretter kalt DNA- 
biter) av den opprinnelige sekvensen. 

Annet trinn bestir i i erstatte baseparene i DNA-bitene med 4 ulike DNA-sekvenser 
(heretter kalt DNA-fragmenter) som representerer hver av de fire basene Adenin, 
Cytosin, Guanin og Thymin. Der hvor det har vaert baspar A-T settes det altsi inn 
«fragment A»> C-G byttes ut med «fragment C», osv. Dermed genereres nye DNA~ 
molekyler hvor den opprinnelige baserekkefelgen pi f.eks. ACGTT. . . erstattes med 
fragment A - fragment C - fragment G osv. Lengden pi disse fire DN A-fragmentene 
kan i prinsippet variere i lengde fra 2bp til flere hundre kbp (eller mer om 0nskelig), alt 
etter behov, Tilsvarende kan DNA-fragmentene inneholde reportergener og annen 
biologisk informasjon, eller kun besta av sekvenser uten kjent biologisk funksjon. 

I tredje trinn avleses rekkef0lgen pi de fire typene DNA-fragmenter for hvert enkelt 
DNA-molekyI, Dermed finner man baserekkefelgen i de opprinnelige DNA-bitene 
indirekte 

I fjerde trinn benytter et dataprogram overlappene mellom DNA-bitene til i sette 
sammen informasjonen fra trinn 3 til sekvensen pi DN A-sekvensene som ble brukt som 
utgangspunkt. 



Trinn 1 

Farste trinn i metoden bestir i i behandle en liten mengde DNA med DNAse, 
sonikering eller lignende teknikker slik at DNA-molekylene blir fragmentert i biter (kalt 
DNA-biter). Ved i justere parametrene i disse teknikkene har man muligheten lil i 
justere den gjennomsnittlige starrelsen pi DNA-bitene (det optimale vil som regel vsere 
i ha gjennomsnittlige storrelser pi noen hundre basepar). Metodene bar i tillegg vsere 
relativt uspesifikk e med tanke pi hvor de kutter/brekker DNA-molekylene 9lik at man 
statistisk sett vil fl DNA-biter som er kuttet/brukket pi de fleste steder i den 
opprinnelige sekvensen. 



Trinn 2 

I prinsippet kan dette trinnet leses pi svaert mange miter, nedenfor felger 1 altemativ: 

Figur 2 illustrerer en metode som baserer seg pi restriksjonsenzymer som kutter 
utenfor sitt eget DNA-bindingssete. Disse enzymene viser ingen spesifisitet for 
sekvensen som kuttes og de kan derfor generere overheng med alle typer 
basesamensetning. For i Ulustrere metoden er det brukt et enzym som kun genererer 
overheng pi 1 bp. 1 praksis bar man nok velge enzymer som genererer 3-4bp overheng. 
Ved i bruke termostabile ligaser vil spesifisiteten likevel vaere ivaretatt mens 
effektiviteten 0ker dramatisk slik at inkubasjonstiden reduseres. Samtidig reduserer 
man antallet sykluser 3-4 ganger. 
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Populagjcn mod 
DNAxnoleAcyler 
§om anskes 
fldcvoueit 



ACOTTGACTGAA ACGTrGACTGAA 

ACOTTGACTGAA ACQrrOACTGAA 
ACOTTGACTQAA ACOTTGACTGAA 



Trinn 1 (fragmentering) 



ACOTT GACTGAA 
ACQTTOA CTOAA 
AC OTIGACTOAA 



ACQT TGACTGAA 
ACOTT GACTGAA 
ACGTTGACTG AA 



Trinn 2 (konvertering) 



fragm e nt 



Trinn 3 (avlesning): 
Rekkefelgen p& fragmentene «A», «C», «G» og «T» 
avleses for hvert DN A-molekyl. 



m 



Trinn 4(rekonstruksjon): 
Et dataprogram setter DNA-bitene 
sammen til den opprinnelige sekvensen: 

AC 
ACGT 
ACGTT 
ACGTT 
ACGTTGA 
ACCTTGACTG 
GTTGACTGAA 
TGACTGAA 
GACTGAA 
GACTGAA 
CTGAA 
AA 

ACGTTGACTG AA 

Fig.l. Grunnprinsippet for DNA-sekvenseringsmetoden. Sterrelsen pa DNA-bitene vil 
naturlig nok vaere starre enn angitt i denne figuren 
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Flg.2 1) DNA-bitenc fra Trinn I ligeres inn i el plasmid som har bindingsseter for el 
restiiksjonsenzym ( M Enz. I ") som genererer blunl-cnd kull og el som kutter ulenfor silt egel DNA- 
bindingssete og genererer Ibp overheng CEtul 11 ). I lillcgg or dct innkorporcrt biotinbaser i plasraidel 
slik at del henger fast i del sircpiavidinbehandlede reagensrorct hvor rcaksjoncn forcg&r, Fordclen 
med sistnevnte cr at biprodukier fra en*y mrcaksjoncne kan fjcrnes for hverl trinn. 2) reagensnaret 
skylles og en ny reaksjonsblanding inneholdende M En/.l * og "Enx2" tilscilcs og inkuberes slik at del 
dannes en blunt ende og en endc hvor den ferste basen i DN A-biicn utgjer cl overheng. 3) 
reagensrorel skylles p& nyll og cn reaksjonsblanding inneholdende (Ire ulikc DNA-fragmenler 
sammen med en tcrmosiabil DNA-iigase (f.eks. Pfu cllcr Taq DN A-ligase) lilseltes og inkuberes. 
Fordelen mod dc termoslabile ligasenc cr at do Hgcrer mecel spesifikl samlidig som de ikke ligerer 
Mum endcr. Denned vil «fragmenl A» ligeres inn der hvor del er adenosin som overheng, «fragment 
C» der hvor del er en cylosin, osv. 4) reagensrorel skylles nok en gang og cn reaksjonsblanding med 
T4 ligase lilseltes og inkuberes slik at bluni endene ligeres. Siden de innligerte fragmentene har seter 
for Enzl og Enz2 slik som plasmidel hadde opprinnelig cr man lilbakc til ulgangspunklel slik at 
nesle base kan byltes ut med et DN A-fragment i cn ny syklus. 
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Trinn 3 

Pi samme mite som for trinn 2 lean ogsi trinn 3 utfores pi mange alternative miter: 

1) For i finne en bedre metode til i lokalisere fluorescerende DNA-prober brukte 
Weier et al (ref) en teknikk kalt «molecular combing», En tesning med mil-DNA som 
probene ble hybridisert til ble plassert pi en flat glassoverflate preparert slik at DNA- 
molekylene festet seg med en av endene til glassplaten. Deretter fikk de DNA- 
molekylene til i relle seg ut ved hjelp av en vasskestrem. Ved hjelp av et fluorescens 
mikroskop kunne de dermed observere probenes relative posisjoner pi de utstrakte 
DNA-molekylene. Ved i bruke fire prober merket med ulike fluoroforer og som 
hybridiserer til de fire DNA-fragmentene som representerer « A», «C», «G» og «T» vi: 
den ovenstiende teknikken kunne brukes til i avlese sekvensrekke&lgen direkte med 
et fluorescensmikroskop. Ved i utvikle programvare som gjer at mikroskopet 
«scanner» glassplaten samtidig som sekvensrekkefiartgene analyseres automatisk vil det 
sannsynligvis bli mulig i avlese flere tusen basepar per minutt. 

HI 2) Potensialet for hurtig avlesning vil sannsynligvis vaere enda sterre hvis man 

anvender et flowcytometer for i avlese de fluoroscerende probene. En forutsetning for 
dette er at DNA-molekylene passerer avlesningsenheten pi et flowcytometer i 
utstrukket form slik at DNA-fragmentene som representerer «A», «C», «G» og «T» vil 
passere i rekkefiartge. 

En metode for i f& DNA-molekylene utstrukket er i blande dem med smi 
glasskuler (binder DN A-molekyler naturlig) i stort overskudd slik at de binder DNA- 
molekylene i forholdet 1:1. DNA-molekylene vil ha mindre motstand enn glasskulene i 
. en vaeskestrem slik at de tenderer til i bevege seg bort fra hverandre belt til DNA- 
molekylet er utstrukket. Hvis vaeskestrammen er kraftig eller glasskulene store slik at 
forskjellen i motstand for DNA-molekylene og glasskulene er stor vil DNA-molekylet 
kunne ryke. Dette problemet vil imidlertid kunne unngis ved i senke flow-hastigheten 
eller bruke mindre glasskuler. 

En alternativ slrategi er i bruke et elektrisk eller magnetisk felt i steden for 
vsskestrem til i trekke partiklene forbi fluorescensdetektoren. Det kan gjeres ved & 
utnytte at glasskulene har positiv ladning mens DNA-molekyler er negativt ladd, eller 
bruke superparamagnetiske kuler istedenfor glass. Dermed vil kulene trekke DNA- 

Ifp molekylene som henger etter som r ette trider, 

^ En kritisk parameter ved denne strategien er flowcytometrenes nedre 

deteksjonsgrenser for fluorescens. Flere ga pper har klart i detektere enkelte 
fluorofor-molekyler ved i senke flow-hastigheten. 0nsker man imidlertid i bruke 
konvensjonelle flow-cytometre med analysehastigheter pi 20-30.000 partikler per 
sekund mi man bruke lengre prober slik at det kan festes mange fluroforer til hver 
probe. 

De raskeste flowcytometrene per i dag har kapasitet til i analysere ca. 200.000 
fluorescerende partikler per sekund . Disse flowcytometrene er imidlertid ikke 
kommersielt tilgjengelige. I tillegg kommer at det er usikkert hvor heye flow- 
hastigheter DNA-molekyler tiler i utstrukket form fer de ryker. Det er imidlertid 
realistisk i anta at DNA-molekylene vil tile hastigheter som gjar det mulig i avlese et 
sted meilom 5-50 tusen basepar per sekund (med en hastighet pi 50,000 bp/s vil et£ 
flowcytometer kunne avlese 3 billioner bp (tilsvarende det humane genom) pi i 
underkant av 17 timer. Sammenlignet med HUGO-prosjektet hvor man regner med i 
bruke 17 ir og betydelige laboratorieressurser i over 20 land pi i fi sekvensert det 
forste humane genom vil dette representee en betydelig nyvinning.) 
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3) En rekke andre strategier kan tenkes for 4 avlese rekkefelgen pi DNA-fragmentene 
i de ulike DNA-bitene. I tillegg kommer at ideen om & konvertere et DNA-molekyl til 
DNA-fragmenter innsatt i samme r kkefcrlge som de opprinnelige baseparene vil kunne 
lese en del av de problemene som har oppstitt i forbindelse med andre DNA- 
sekvenseringsprosjekter. 



Trinn4 

I siste trinn brukes et dataprogram til £ sette sammen sekvensbitene til den endelige 
sekvensen. Sannsynligheten for at det skal inntreffe feil i dette trinnct avhenger 
hovedsakelig av 5 parametre; Lengden pi DNA-moIekylet som skal sekvenseres, hvor 
randomised: baseparsammensetningen av DNA-sekvensen er, lengden pi DNA-bitene 
som skal avleses, antallet DNA-biter som blir avlest, feilfrekvensen i trinn 2 og 3, 

Jeg har allerede laget et dataprogram for & analysere betydningen av de 
ovenstiende parametrene. Med utgangspunkt i human genomisk DNA som allerede er 
sekvensert viser analysene at med en DNA-bit lengde p& 30 fragmenter, avlesning av 
6* 10s DNA-biter og en feilfrekvens t trinn 2 og 3 p4 10% (med tanke p& 
punktmutasjoner) vil et humant genom kunne avleses i £n sekvensreaksjon og med 
svsert fk punktmutasjoner/delesjoner. Et unntak er imidlertid sv«rt ikke-randomiserte 
omrider (satellitt DNA og andre repetitive omr&der) hvor DNA-bit lengdene mi ekes. 
Den biologiske informasjonen i disse omr&dene er imidlertid av underordnet betydning 
sammenlignet med kodende sekvenser og cis-regulatoriske elementer. 

Dataanalysene viser ogs4 at selv en meget hay feilfrekvens i trinn 2 og 3 
kompenseres ved at DNA-bitene avleses mange ganger. Ved I avlese f.eks. 10 ganger 
si mange basepar som sekvensens lengde vi! man elliminere de fleste delesjoner og 
punktmutasjoner selv med en meget hay feilfrekvens i trinn 2 og 3. 
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Patentkrav 

Fremgangsmite for DN A-sekvensering som bestir av fire trinn: 

Fgrgte trinn tar utganspunkt i en ren DN A-populasjon bestiende av DN A-sekvensen 
som skal sekvenseres. DNA-moIekylene kuttes/brekkes pi en uspesifikk mite slik at 
det dannes en populasjon med DNA-molekyler bestiende av biter (heretter kalt DNA- 
biter) av den opprinnelige sekvensen. 

Anqet trinn bestir i i erstatte baseparene i DNA-bitene med 4 ulike DNA-sekvenser 
(heretter kalt DNA-fragmenter) som representee hver aiv de fire basene Adenin, 
Cytosin, Guanin og Thymin. Der hvor det har vaert baspar A-T settes det altsi inn 
«fragment A», C-G byttes ut med «fragment C», osv. Dermed genereres nye DNA- 
molekyler hvor den opprinnelige baserekkef0lgen pi f eks, ACGTT. . . erstattes med 
fragment A - fragment C - fragment G osv. Lengden pi disse fire DNA-fragmentene 
kan i prinsippet variere i lengde fra 2bp til flere hundrc kbp (eller mer om 0nskelig), alt 
etter behov. Tilsvarende kan DNA-fragmentene inneholde reportergener og annen 
biologisk informasjon, eller kun besti av sekvenser uten kjent biologisk funksjon. 

I tredje trinn avleses rekkefolgen pi de fire typene DNA-fragmenter for hvert enkelt 
DNA-molekyl. Dermed finner man baserekkefolgen i de opprinnelige DNA-bitene 
indirekte. 

1 fierde trinn benytter et dataprogram overlappene mellom DNA-bitene til i sette 
sammen informasjonen fra trinn 3 til sekvensen pi DNA-sekvensene som We brukt som 
utgangspunkt. 



♦END** 
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Sammendrag 



Min oppfinnelse anglr en helt ny innfalsvinkel til en ikke-gelbasert 
fremgangsrnite for DNA-sekvensering. Fremgangsm&ten bestir av flere trinn 
og det finnes flere alternative lesninger for hvert av dem. Det sentrale er 
imidlertid at DNA-sekvensen «forst0ires» ved & erstatte basepar med lengre 
DNA-sekvenser. Dermed ipnes mange muligheter for avlesning av DNA- 
sekvensen. 
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